    Detection of heart pathology using deep learning methods

    In the directions of modern medicine, a new area of processing and analysis of visual data is actively developing - a radio municipality - a computer technology that allows you to deeply analyze medical images, such as computed tomography (CT), magnetic resonance imaging (MRI), chest radiography (CXR), electrocardiography and electrocardiography. This approach allows us to extract quantitative texture signs from signals and distinguish informative features to describe the heart's pathology, providing a personified approach to diagnosis and treatment. Cardiovascular diseases (SVD) are one of the main causes of death in the world, and early detection is crucial for timely intervention and improvement of results. This experiment aims to increase the accuracy of deep learning algorithms to determine cardiovascular diseases. To achieve the goal, the methods of deep learning were considered used to analyze cardiograms. To solve the tasks set in the work, 50 patients were used who are classified by three indicators, 13 anomalous, 24 nonbeat, and 1 healthy parameter, which is taken from the MIT-BIH Arrhythmia database

    Визначення кількості кластерів нормалізованих вегетаційних індексів із використанням алгоритму k-means

    The process of clustering of normalized vegetation indices in five regions with a total area of 2565 hectares of the North Kazakhstan region was studied. A methodological approach to organizing the clustering process is proposed using the vegetation indices NDVI, MSAVI, ReCI, NDWI and NDRE, taking into account individual characteristics in the three main phases of spring wheat development As a result of the research, vegetation indices were grouped into 3 classes using the k-means clustering method. The first cluster contained vegetation indices whose maximum values occupied about 33.98% of the total area of the study area. It was found that NDVImax located in the first cluster was positively correlated with soil-corrected vegetation indices MSAVI and crop moisture indicators NDMI (R2=0.92). The second cluster is characterized by minimum values of NDVImax coefficients at the germination, tillering and ripening phases (from 0.53 to 0.55). The lowest values of vegetation indices occupied 35.9 % in the germination phase, 37.9 % in the tillering phase, and 40.1 % of the field from the total area. The third cluster is characterized by average values of vegetation indices in all three phases. A correlation matrix was also constructed to assess the closeness of the relationship between actual yield and NDVI vegetation indices. The maximum coefficient was obtained at the germination phase, R=0.94 with a minimum significance coefficient p=0.018. The approach used in this study can be useful in the analysis of satellite data, as it can improve the sensitivity of the constellation procedure. From a practical point of view, the results obtained make it possible to assess the condition of agricultural crops in the early stages of the growing season, which makes it possible to improve their productivity based on the results of cluster analysisДосліджено процес кластеризації нормалізованих вегетаційних індексів у п'яти районах із загальною площею 2565 гектарів Північно-Казахстанської області. Запропоновано методичний підхід до організації процесу кластеризації з використанням вегетаційних індексів NDVI, MSAVI, ReCI, NDWI та NDRE з урахуванням індивідуальних характеристик у трьох основних фазах розвитку ярої пшениці У результаті проведених досліджень вегетаційні індекси згруповано на 3 класи, з використанням методу кластеризації k-середніх, На першому кластері було скомпоновано вегетаційні індекси, максимальні значення яких займає близько 33.98 % від загальної площі досліджуваної області. Було виявлено, що розташовані на першому кластері NDVImax позитивно корелюють із вегетаційними індексами з поправкою на ґрунт MSAVI та індикаторами вологості культури NDMI (R2=0.92). Другий кластер характеризується з мінімальними значеннями коефіцієнтів NDVImax і на фазах сходу, кущіння та дозрівання (від 0.53 до 0.55). Найменші значення вегетаційних індексів займали 35,9 % у фазі сходу, 37,9 % у фазі кущіння, 40,1 % поля від загальної площі. Третій кластер характеризується середніми значеннями вегетаційних індексів у всіх трьох фазах. Також було побудовано кореляційну матрицю для оцінки тісноти зв'язку між фактичною врожайністю та вегетаційними індексами NDVI. Максимальний коефіцієнт було отримано на фазі сходів, R=0.94 з мінімальним коефіцієнтом значущості p=0.018. Застосований у цьому дослідженні підхід може бути корисним під час аналізу супутникових даних, оскільки дає змогу поліпшити чутливість процедури групування. З практичної точки зору, отримані результати дають змогу оцінювати стан сільськогосподарських культур у ранні терміни вегетації, що дає змогу покращити їхню продуктивність на основі отриманих результатів кластерного аналізу.

    Реалізація моделей машинного навчання для визначення відповідної моделі передбачення функцій білків

    Predicting the function of proteins is a crucial part of genome annotation, which can help in solving a wide range of biological problems. Many methods are available to predict the functions of proteins. However, except for sequence, most features are difficult to obtain or are not available for many proteins, which limits their scope. In addition, the performance of sequence-based feature prediction methods is often lower than that of methods that involve multiple features, and protein feature prediction can be time-consuming. Recent advances in this field are associated with the development of machine learning, which shows great progress in solving the problem of predicting protein functions. Today, however, most protein sequences have the status of «uncharacterized» or «putative». The need to assess the accuracy of identification of protein functions is an urgent task for machine learning approaches used to predict protein functions. In this study, the performance of two popular function prediction algorithms (ProtCNN and BiLSTM) was assessed from two perspectives and the procedures for building these models were described. As a result of the study of Pfam families, ProtCNN achieves an accuracy rate of 0.988 % and bidirectional LSTM has an accuracy rate of 0.9506 %. The use of the Pfam dataset allowed increasing the classification accuracy due to the large training dataset. The quality of the prediction increases with a large amount of training data. The study demonstrated that machine learning algorithms can be used as an effective tool for building protein function prediction models, in particular, the CNN network can be adapted as an accurate tool for annotating protein functions in the presence of large datasets.Передбачення функцій білків є важливою частиною анотації генома, яка може допомогти у вирішенні широкого спектру біологічних завдань. Існує безліч методів передбачення функцій білків. Однак, за винятком послідовності, більшість ознак важко отримати або вони недоступні для багатьох білків, що обмежує область їхнього застосування. Крім того, ефективність методів передбачення ознак на основі послідовностей часто нижча, ніж у методів, що включають декілька ознак, а передбачення ознак білків може займати багато часу. Останні досягнення в цій області пов’язані з розвитком машинного навчання, що демонструє великий прогрес у вирішенні задачі передбачення функцій білків. Однак сьогодні більшість білкових послідовностей мають статус «нехарактерних» або «припустимих». Необхідність оцінки точності ідентифікації функцій білків є актуальним завданням методів машинного навчання, що використовуються для передбачення функцій білків. В даному дослідженні оцінювалася ефективність двох популярних алгоритмів передбачення функцій (ProtCNN і BiLSTM) з двох точок зору, та були описані процедури побудови цих моделей. В результаті дослідження сімейств Pfam, ProtCNN досягає точності 0,988 %, а двонаправлена LSTM має точність 0,9506 %. Використання набору даних Pfam дозволило підвищити точність класифікації за рахунок великого набору навчальних даних. При великому обсязі навчальних даних якість передбачення збільшується. Дослідження показало, що алгоритми машинного навчання можуть використовуватися в якості ефективного інструменту для побудови моделей прогнозування функцій білків, зокрема, мережа CNN може бути адаптована в якості точного інструменту для анотації функцій білків за наявності великих наборів даних

    Ефективність використання алгоритмів і методів штучних технологій розпізнавання жестової мови для людей з обмеженими можливостями

    According to WHO, the number of people with disabilities in the world has exceeded 1 billion. At the same time, 80 percent of all people with disabilities live in developing countries. In this regard, the demand for the use of applications for people with disabilities is growing every day. The paper deals with neural network methods like MediaPipe Holistic and the LSTM module for determining the sign language of people with disabilities. MediaPipe has demonstrated unprecedented low latency and high tracking accuracy in real-world scenarios thanks to built-in monitoring solutions. Therefore, MediaPipe Holistic was used in this work, which combines pose, hand, and face control with detailed levels. The main purpose of this paper is to show the effectiveness of the HAR algorithm for recognizing human actions, based on the architecture of in-depth learning for classifying actions into seven different classes.  The main problem of this paper is the high level of recognition of the sign language of people with disabilities when implementing their work in cross-platform applications, web applications, social networks that facilitate the daily life of people with disabilities and interact with society. To solve this problem, an algorithm was used that combines the architecture of a convolutional neural network (CNN) and long short-term memory (LSTM) to study spatial and temporal capabilities from three-dimensional skeletal data taken only from a Microsoft Kinect camera. This combination allows you to take advantage of LSTM when modeling temporal data and CNN when modeling spatial data. The results obtained based on calculations carried out by adding a new layer to the existing model showed higher accuracy than calculations carried out on the existing model.За даними ВООЗ, кількість людей з обмеженими можливостями у світі перевищила 1 мільярд. При цьому 80 відсотків проживають в країнах, що розвиваються. У зв'язку з цим попит на використання додатків для людей з обмеженими можливостями зростає з кожним днем. У роботі для визначення жестової мови людей з обмеженими можливостями розглядаються нейромережеві методи, такі як MediaPipe Holistic та LSTM-модуль. Завдяки вбудованим засобам моніторингу MediaPipe продемонстрував безпрецедентно низьку затримку і високу точність відстеження в реальних умовах. Тому у даній роботі використовувався MediaPipe Holistic, що поєднує в собі управління позою, руками і обличчям з деталізованими рівнями. Основною метою статті є показати ефективність алгоритму HAR для розпізнавання фізичної активності людини, заснованого на архітектурі глибокого навчання для класифікації дій за сімома різними класами. Головним завданням даної роботи є високий рівень розпізнавання жестової мови людей з обмеженими можливостями при реалізації їхньої роботи у кросплатформних додатках, веб-додатках і соціальних мережах, що полегшують повсякденне життя людей з обмеженими можливостями та взаємодіють із суспільством. Для вирішення цього завдання використовувався алгоритм, що поєднує в собі архітектуру згорткової нейронної мережі (CNN) і довгої короткочасної пам'яті (LSTM) для вивчення просторових і тимчасових можливостей за тривимірними скелетними даними, взятими тільки з камери Microsoft Kinect. Така комбінація дозволяє використовувати переваги LSTM при моделюванні часових даних і CNN при моделюванні просторових даних. Результати, отримані на основі розрахунків, виконаних додаванням нового шару до існуючої моделі, показали більш високу точність, ніж розрахунки, проведені за існуючою моделлю